Περίληψη
Ο πιστωτικός κίνδυνος είναι μια από τις μεγαλύτερες απειλές που αντιμετωπίζουν τα πιστωτικά ιδρύματα. Η σταδιακή ανάπτυξη του ελέγχου του πιστωτικού κινδύνου οδηγεί στη ανάγκη για συνεχή βελτίωση των μοντέλων πιστωτικού κινδύνου προκειμένου αυτός να αντιμετωπιστεί ή να προβλεφθεί. Για το λόγο αυτό, η παρούσα διατριβή εστιάζει στη συμβολή σε τομείς σχετικούς με μεθόδους πρόβλεψης και επιλογής επεξηγηματικών/ανεξάρτητων μεταβλητών με απώτερο σκοπό την ενίσχυση της αποδοτικότητας των μοντέλων πιστωτικού κινδύνου. Αρχικά, το ενδιαφέρον μας επικεντρώνεται στην κατηγορία μοντέλων πρόβλεψης, συμπεριλαμβανομένου του χαρακτήρα (τύπου) των επεξηγηματικών/ανεξάρτητων μεταβλητών που μπορούν να αξιοποιηθούν σε μοντέλα πιστωτικής βαθμολόγησης (credit scoring models) αλλά και νέοι αλγόριθμοι ταξινόμησης για έγκυρη και αξιόπιστη αξιολόγηση της απόδοσης των προτεινομένων μοντέλων.Εκ πρώτης διερευνούμε την αποτελεσματικότητα των εναλλακτικών δεδομένων στα μοντέλα πιστωτικής βαθμολόγησης. Ως εναλλακτικά ...
Ο πιστωτικός κίνδυνος είναι μια από τις μεγαλύτερες απειλές που αντιμετωπίζουν τα πιστωτικά ιδρύματα. Η σταδιακή ανάπτυξη του ελέγχου του πιστωτικού κινδύνου οδηγεί στη ανάγκη για συνεχή βελτίωση των μοντέλων πιστωτικού κινδύνου προκειμένου αυτός να αντιμετωπιστεί ή να προβλεφθεί. Για το λόγο αυτό, η παρούσα διατριβή εστιάζει στη συμβολή σε τομείς σχετικούς με μεθόδους πρόβλεψης και επιλογής επεξηγηματικών/ανεξάρτητων μεταβλητών με απώτερο σκοπό την ενίσχυση της αποδοτικότητας των μοντέλων πιστωτικού κινδύνου. Αρχικά, το ενδιαφέρον μας επικεντρώνεται στην κατηγορία μοντέλων πρόβλεψης, συμπεριλαμβανομένου του χαρακτήρα (τύπου) των επεξηγηματικών/ανεξάρτητων μεταβλητών που μπορούν να αξιοποιηθούν σε μοντέλα πιστωτικής βαθμολόγησης (credit scoring models) αλλά και νέοι αλγόριθμοι ταξινόμησης για έγκυρη και αξιόπιστη αξιολόγηση της απόδοσης των προτεινομένων μοντέλων.Εκ πρώτης διερευνούμε την αποτελεσματικότητα των εναλλακτικών δεδομένων στα μοντέλα πιστωτικής βαθμολόγησης. Ως εναλλακτικά δεδομένα θεωρούμε τα δεδομένα που προέρχονται από μη παραδοσιακές πηγές και μπορούν να χρησιμοποιηθούν για τη συμπλήρωση παραδοσιακών δεδομένων προκειμένου να παρέχουν καλύτερες πληροφορίες που διαφορετικά δεν θα ήταν εφικτές και τα οποία θεωρούνταν μοναδικά, ασυνήθιστα ή ακριβά πριν από λίγα χρόνια.Για το σκοπό αυτό, δημιουργήσαμε και εισαγάγαμε μεταβλητές οι οποίες προέρχονται από εναλλακτικές πηγές πληροφόρησης, σε ένα ήδη υπάρχον μοντέλο πρόβλεψης για ελληνικά ξενοδοχεία που χρησιμοποιεί μόνο δεδομένα πιστωτικής συμπεριφοράς. Για την ανάλυση αυτή χρησιμοποιήθηκε ένα πραγματικό σύνολο δεδομένων πιστωτικής βαθμολόγησης 678 ελληνικών ξενοδοχείων, το οποίο παραχωρήθηκε από την ιδιωτική βάση δεδομένων της ΤΕΙΡΕΣΙΑΣ Α.Ε. (μια εταιρεία που ιδρύθηκε από σχεδόν όλες τις τράπεζες της Ελλάδας). Συγκρίνοντας το «εναλλακτικό» μοντέλο με το ήδη υπάρχον χρησιμοποιώντας τους δείκτες απόδοσης K-S, Gini Index και ακρίβεια (accuracy), καταλήξαμε στο συμπέρασμα ότι τα εναλλακτικά δεδομένα συμβάλλουν στην απόδοση του μοντέλου. Έχοντας διαπιστώσει τη βελτίωση της απόδοσης του μοντέλου για τα ελληνικά ξενοδοχεία, μπορούμε εύκολα να συμπεράνουμε ότι θα ήταν συνετό να διερευνήσουμε τη χρησιμότητα εναλλακτικών δεδομένων και σε άλλους κλάδους.Στη συνέχεια, πραγματοποιήθηκε μια συγκριτική μελέτη αξιολόγησης 12 αλγορίθμων ταξινόμησης στο ίδιο σύνολο δεδομένων για να συγκρίνουμε νέες με παραδοσιακές μεθόδους ταξινόμησης. Κατά την επιδίωξη αυτού του στόχου, συγκρίναμε αυτούς τους αλγόριθμους ταξινόμησης ως προς την AUC και την ακρίβεια. Τα αποτελέσματά μας έδειξαν ότι υπάρχουν μικρές διαφορές μεταξύ των τιμών των δεικτών απόδοσης σε κάθε ταξινομητή και πιθανόν αυτό να συμβαίνει επειδή εργαζόμαστε σε ένα ομοιογενές δείγμα. Συγκεκριμένα, παρατηρήσαμε ότι η λογιστική παλινδρόμηση και τα νευρωνικά δίκτυα είχαν καλύτερη απόδοση από άλλους (νέους ή μη) ταξινομητές και η λογιστική παλινδρόμηση είχε την υψηλότερη τιμή AUC.Η συνεισφορά αυτής της ανάλυσης έγκειται αρχικά στην αξιοποίηση εναλλακτικών δεδομένων (alternative data) σε μοντέλα πρόβλεψης τα οποία παραδοσιακά χρησιμοποιούν μόνο κλασικά δεδομένα πιστωτικής συμπεριφοράς. Επιπλέον, συνεισφέρει στη σχετική βιβλιογραφία με τον καθορισμό και την αξιοποίηση μεταβλητών από εναλλακτικές πηγές πληροφόρησης με εφαρμογή στον ξενοδοχειακό τομέα. Επίσης, παρέχει πολύτιμες πληροφορίες για τους επαγγελματίες, καθώς μπορούν να εκμεταλλευτούν νέους αλγόριθμους ταξινόμησης όσον αφορά τα μοντέλα πρόβλεψης. Επιπλέον, παρέχουμε μια αξιολόγηση των πρόσφατων μεθόδων βαθμολόγησης για να βοηθήσουμε τη μελλοντική έρευνα. Συνεχίζοντας λοιπόν να στοχεύουμε στη μέγιστη απόδοση των μοντέλων πρόβλεψης και επιθυμώντας να συνεισφέρουμε στον τομέα των επιχειρήσεων καθώς και στον ευρύτερο βιομηχανικό κλάδο (όχι μόνο στον ξενοδοχειακό κλάδο), αποφασίσαμε να διερευνήσουμε ένα συνδυασμό δεδομένων σχετικά με τις ανεξάρτητες μεταβλητές που θα απαρτίζουν μοντέλα πρόβλεψης για εταιρείες. Δεδομένου ότι τα χρηματοοικονομικά δεδομένα είναι συνήθως τα μόνα δεδομένα που χρησιμοποιούνται στη μοντελοποίηση (τόσο στην Ελλάδα όσο και σε άλλες χώρες) για την αξιολόγηση του πιστωτικού κινδύνου μιας εταιρείας, αποφασίσαμε να χρησιμοποιούμε έναν συνδυασμό δεδομένων οικονομικής και πιστωτικής συμπεριφοράς. Στη συνέχεια, τα προτεινόμενα μοντέλα (με το συνδυασμό δεδομένων) συγκρίθηκαν με τα παραδοσιακά μοντέλα (που περιέχουν μόνο οικονομικά δεδομένα) χρησιμοποιώντας τρεις δείκτες απόδοσης, την ακρίβειας, το K-S και το Gini Index.Μετά τη σύγκριση των μοντέλων, καταλήξαμε στο συμπέρασμα ότι τα νέα μοντέλα συμβάλλουν στην εκτίμηση του πιστωτικού κινδύνου όπως φαίνεται από την απόδοσή τους. Τέλος η διατριβή συμβάλει και στην ανάλυση μεγάλης κλίμακας δεδομένων αφού πραγματεύεται το πρόβλημα της επιλογής μεταβλητών που σε συνδυασμό με την αξιοποίηση της τεχνικής μείωσης της διάστασης επιτυγχάνει την κατασκευή ευέλικτων και αξιόπιστων μοντέλων ταξινόμησης που αφορούν στις Ελληνικές επιχειρήσεις (ένα μοντέλο για μικρές και ένα για μεγάλες επιχειρήσεις), βάσει της πιστωτικής συμπεριφοράς τους. Για τη μοντελοποίηση, προτείνουμε μια αλγοριθμική διαδικασία 3 (4) βημάτων για τη μείωση των διαστάσεων με ένα αρχικό στάδιο προκαταρκτικής επεξεργασίας δεδομένων (βήμα 0) το οποίο πραγματοποιήθηκε και στις προηγούμενες αναλύσεις και είναι το εξής:Xρησιμοποιήσαμε την κωδικοποίηση Weight-of-Evidence (WOE) για να δημιουργήσουμε ψευδομεταβλητές προκειμένου να ομαδοποιήσουμε όλες τις ανεξάρτητες μεταβλητές. Το κύριο τμήμα του αλγορίθμου βασίζεται σε τεχνικές μείωσης διάστασης λαμβάνοντας υπόψη το σταδιακό κριτήριο πληροφοριών Akaike και την ανάλυση κυρίων συνιστωσών (PCA). Η προτεινόμενη διαδικασία επιτρέπει ένα προαιρετικό 4ο βήμα που βασίζεται στην Elastic Net Regularization για περαιτέρω μείωση της διάστασης εάν ο ερευνητής πιστεύει ότι αυτό είναι χρήσιμο.Τα ευρήματα αυτής της ανάλυσης δείχνουν σαφώς τη σημασία στη χρήση μεταβλητών πιστωτικής συμπεριφοράς, δεδομένου ότι ορισμένες από αυτές τις μεταβλητές βρέθηκαν να διαδραματίζουν βασικό ρόλο στη δημιουργία μοντέλων πιστωτικής βαθμολόγησης τόσο για τις μικρές όσο και για τις μεγάλες επιχειρήσεις. Πράγματι, στο τελικό μοντέλο για τις μικρές επιχειρήσεις, κάθε μεταβλητή PCA εξαρτάται από 6 μεταβλητές πιστωτικής συμπεριφοράς (από ένα σύνολο 15 μεταβλητών) ενώ για το τελικό μοντέλο μεγάλων επιχειρήσεων κάθε μεταβλητή PCA εξαρτάται από 10 μεταβλητές πιστωτικής συμπεριφοράς (από ένα σύνολο 18 μεταβλητών). Η χρήση τέτοιων συνδυασμών είναι μια από τις κύριες συνεισφορές της παρούσας διατριβής, δεδομένου ότι οι χώρες βασίζονται σχεδόν αποκλειστικά στις οικονομικές μεταβλητές. Αξίζει επίσης να σημειωθεί ότι η προτεινόμενη μεθοδολογία ανταποκρίνεται στην ανάγκη μείωσης των διαστάσεων για την κατασκευή ευέλικτων αλλά και αξιόπιστων μοντέλων πιστοληπτικής ικανότητας όχι μόνο για περιγραφικούς αλλά και κυρίως για προβλεπτικούς σκοπούς. Επιπλέον, η προτεινόμενη μεθοδολογία παρέχει, μεταξύ άλλων, στους ασφαλιστές, στους χρηματοοικονομικούς σχεδιαστές και στους δανειστές ένα αυτοματοποιημένο αξιόπιστο χρηματοοικονομικό εργαλείο αξιολόγησης της πιστοληπτικής ικανότητας σύμφωνα με μερικές στατιστικά σημαντικές χρηματοοικονομικές και πιστωτικές μεταβλητές και ταυτόχρονα τη λήψη πιστωτικών αποφάσεων γρηγορότερα και πιο δίκαια ενώ προσφέρει στους δανειολήπτες αυξημένες ευκαιρίες δανεισμού.Επίσης, το μοντέλο μείωσης της διάστασης που προτείνεται μπορεί να εφαρμοστεί στη μοντελοποίηση της πιστοληπτικής ικανότητας φορολογικού χρέους. Η σημασία της πρόβλεψης που προκύπτει από τους οργανισμούς αξιολόγησης φορολογικού χρέους είναι ένα άλλο πεδίο πιθανών επεκτάσεων. Η σημασία των προβλέψεων που αφορούν τόσο τα μοντέλα αξιολόγησης πιστωτικού κινδύνου όσο και τα μοντέλα αξιολόγησης φορολογικού χρέους μπορεί να δοκιμαστεί χρησιμοποιώντας μη παραμετρικές μεθόδους.
περισσότερα
Περίληψη σε άλλη γλώσσα
Credit risk is one of the biggest threats facing credit institutions. The gradual development of credit risk control leads to the need for continuous improvement of credit risk models in order to face or predict it. For this reason, this thesis focuses on the contribution to areas related to methods of forecasting and selection of explanatory / independent variables with the ultimate goal of enhancing the profitability of credit risk models. Initially, our interest is focused on the category of forecasting models, including the nature (type) of explanatory / independent variables that can be used in credit scoring models but also new classification algorithms for valid and reliable evaluation of the performance of the proposed models.We first explore the effectiveness of alternative data in credit rating models. As alternative data we consider data derived from non-traditional sources and can be used to supplement traditional data in order to provide better information that would other ...
Credit risk is one of the biggest threats facing credit institutions. The gradual development of credit risk control leads to the need for continuous improvement of credit risk models in order to face or predict it. For this reason, this thesis focuses on the contribution to areas related to methods of forecasting and selection of explanatory / independent variables with the ultimate goal of enhancing the profitability of credit risk models. Initially, our interest is focused on the category of forecasting models, including the nature (type) of explanatory / independent variables that can be used in credit scoring models but also new classification algorithms for valid and reliable evaluation of the performance of the proposed models.We first explore the effectiveness of alternative data in credit rating models. As alternative data we consider data derived from non-traditional sources and can be used to supplement traditional data in order to provide better information that would otherwise not have been achievable and which was considered unique, unusual or expensive a few years ago.For this purpose, we created and introduced variables that come from alternative sources of information, in an already existing forecast model for Greek hotels that uses only credit behavior data.For this analysis, a real set of credit scoring data of 678 Greek hotels was used, which was provided by the private database of TEIRESIA SA. (a company founded by almost all banks in Greece). Comparing the "alternative" model with the existing one using the performance indicators K-S, Gini Index and accuracy, we came to the conclusion that the alternative data contribute to the performance of the model. Having seen the improvement in model performance for Greek hotels, we can easily conclude that it would be wise to explore the usefulness of alternative data in other industries as well.Then, a comparative evaluation study of 12 classification algorithms in the same data set was performed to compare novel with traditional classification methods. In pursuit of this goal, we compared these classification algorithms in terms of AUC and accuracy. Our results showed that there are small differences between the values of the performance indicators in each classifier and this is probably because we are working on a homogeneous sample. In particular, we observed that logistic regression and neural networks performed better than other (new or not) classifiers and logistic regression had the highest AUC.The contribution of this analysis lies primarily in the use of alternative data in forecasting models that traditionally use only classical credit behavior data. In addition, it contributes to the relevant literature by defining and utilizing variables from alternative sources of information with application in the hotel sector. It also provides valuable information for professionals, as they can take advantage of new classification algorithms for predictive models. In addition, we provide an assessment of recent scoring methods to assist in future research.Continuing to aim for maximum performance of forecasting models and wishing to contribute to the business sector as well as to the wider industry (not just the hotel industry), we decided to explore a combination of data on the independent variables that will make up forecasting models for companies . Given that financial data is usually the only data used in modeling (both in Greece and in other countries) to assess a company's credit risk, we decided to use a combination of financial and credit behavior data.The proposed models (with the data combination) were then compared with the traditional models (containing only financial data) using three performance indicators, the accuracy, the K-S and the Gini Index.After comparing the models, we came to the conclusion that the new models contribute to the assessment of credit risk as shown by their performance.Finally, this thesis also contributes to the analysis of big data since it deals with the problem of selecting variables which in combination with the utilization of the dimension reduction technique achieves the construction of flexible and reliable classification models for Greek companies (one model for small and one for large companies), based on their credit behavior.For the modeling, we propose an algorithmic procedure of 3 (4) steps to reduce the dimensions with an initial stage of preliminary data processing (step 0) which was performed in the previous analyzes and is as follows:We used the Weight-of-Evidence (WOE) encoding to generate dummy variables in order to group all the independent variables.The main part of the algorithm is based on dimension reduction techniques taking into account the Akaike step-by-step information criterion and principal component analysis (PCA). The proposed procedure allows an optional 4th step based on Elastic Net Regularization to further reduce the dimension if the researcher believes this is useful.The findings of this analysis clearly show the importance of using credit behavior variables, as some of these variables have been found to play a key role in creating credit rating models for both small and large businesses. Indeed, in the final small business model, each PCA variable depends on 6 credit behavior variables (out of a total of 15 variables) while in the large enterprise final model, each PCA variable depends on 10 credit behavior variables (out of a total of 18 variables). The use of such combinations is one of the main contributions of the present thesis, as countries rely almost exclusively on economic variables. It is also worth noting that the proposed methodology responds to the need to reduce the dimensions for the construction of flexible but also reliable credit models not only for descriptive but also mainly for predictive purposes.In addition, the proposed methodology provides, among others, insurers, financial planners and lenders with an automated reliable financial instrument for assessing creditworthiness according to some statistically significant financial and credit variables and at the same time offers creditworthiness to borrowers increased lending opportunities.Also, the proposed dimension reduction model can be applied to the modeling of fiscal debt creditworthiness. The importance of forecasting arising from fiscal debt rating agencies is another area of potential extensions. The significance of the provisions concerning both credit risk assessment models and fiscal debt assessment models can be tested using non-parametric methods.
περισσότερα